王海兰:试论语言数据的经济属性
2022年第4期
专题研究
语言数据与数字经济
作者简介
王海兰
广州大学副教授,主要研究方向为语言经济、语言服务与语言传播。
试论语言数据的经济属性
王海兰
(广州大学 人文学院/国家语委国家语言服务与粤港澳大湾区语言研究中心 广东 广州 510006)
提 要 数字经济时代,数据成为关键生产要素,语言数据则是最为重要的数据类型。在语言作为人力资本、制度、产业之外,语言作为数据成为语言要素参与社会生产的一种新形式,展现出显著的经济属性,主要表现在3个方面:第一,语言数据是数字技术发展的重要“物质基础”,可促进数字技术创新发展和数字技术资本积累;第二,语言数据是生成用于决策的信息和知识最重要的“原始材料”,可优化资源配置,提高全要素生产率;第三,语言数据是新语言职业和语言产业形成和发展的“助推器”,可促进社会分工,优化产业结构。挖掘语言数据经济红利,需要树立语言数据经济意识,推动语言数据价值化,培育和发展语言数据相关职业和产业。
关键词 数字经济;语言数据;语言经济;语言职业;语言产业
一、引 言
语言的本质是信息的载体和交流的媒介,信息交换伴随着人类社会发展的始终,更是人类经济生活的根本(宋景尧2019)。语言与经济有着千丝万缕的联系,可以说,人类的一切经济活动都离不开语言。1965年,信息经济学家雅各布·马尔沙克(Jacob Marschak)在考察信息传递效率问题时,指出语言具有与其他资源一样的经济特征,如价值、效用、费用和收益等,首次提出“语言经济学”概念(Marschak 1965)。关于语言影响经济增长的机制,或者说对语言经济属性的观察路径,目前主要有3个维度:第一,语言能力作为一种重要的人力资本,影响劳动者的收入和就业(Grenier 1984;Chiswick 1991;刘国辉,张卫国2016;王海兰2018);第二,语言作为一种制度,与信任、文化、信息传递和家庭偏好等密切相关,是影响交易成本的重要因素(Ku & Zussman 2010;张卫国2008;黄少安2015;王海兰2017),语言政策和规划作为国家的重要制度安排也是语言经济学研究的一个重要维度(Grin 2003;薄守生2008;赵世举,葛新宇2017);第三,语言作为经济生产的对象,可发展为语言产业,影响经济发展(苏剑2014;陈鹏2017;李艳2017;李宇明2019)。
语言因素参与社会生产的形式、方式和程度与经济发展中所需的生产要素、生产方式等密切相关,在农业经济、工业经济和信息经济不同的经济形态中,语言经济属性的显示度和大小存在很大差异。在人口流动和信息化两大驱力的推动下,语言对经济的贡献越来越显著,以至于成为不容漠视的经济现象(李宇明2012)。当前,人类已进入数字经济时代,数字技术带来生产方式的巨大变革,数据要素成为关键生产要素。无论是从量上还是质上看,语言数据都是最为重要的数据,因而也是重要的生产要素(李宇明2020)。在数字经济时代,在语言作为人力资本、制度、产业之外,语言作为数据成为语言要素参与社会生产的一种新形式。语言数据具有哪些经济属性,在数字经济发展中发挥什么作用,怎么发挥作用,如何挖掘语言数据的经济红利,这是数字经济时代语言经济学需要回答的问题。
二、语言数据经济属性的主要表现
人类已进入数字经济时代。中国信息通信研究院提供的数据显示,2020年,其测算的47个国家数字经济增加值规模达到32.6万亿美元,同比名义增长3.0%,占所测算国家GDP总量的43.7%;其中发达国家数字经济规模达到24.4万亿美元,占其GDP总量的54.3%。[1]2020年,我国数字经济规模达到39.2万亿元,较2019年增加3.3万亿元,占GDP总量的38.6%。[2]国家统计局发布的《数字经济及其核心产业统计分类(2021)》将数字经济定义为“以数据资源作为关键生产要素、以现代信息网络作为重要载体、以信息通信技术的有效使用作为效率提升和经济结构优化的重要推动力的一系列经济活动”。数字经济的定义包括4层含义:第一,数字经济是继农业经济、工业经济之后的一种新的经济形态,是信息经济发展的高级阶段;第二,以数字技术为核心的信息通信技术是数字经济的主要驱动力;第三,数据资源是数字经济的关键生产要素;第四,数字经济发展的重要推力是数字技术和数据要素驱动下生产效率的提升和经济结构的优化。
[1] 参见中国信息通信研究院《全球数字经济白皮书——疫情冲击下的复苏新曙光》,http://www.caict.ac.cn/kxyj/qwfb/bps/
202108/t20210802_381484.htm。
[2] 参见中国信息通信研究院《中国数字经济发展白皮书》,http://www.caict.ac.cn/kxyj/qwfb/bps/202104/t20210423_374626.htm。
语言数据是以语言符号体系为基础构成的各种数据,内部包括语言学科数据、话语数据、语言衍生数据、人工语言数据和语言代码数据等5种类型(李宇明,王春辉2022),是最为重要的数据形式。结合数字经济的定义和语言数据与数据的关系,语言数据的经济属性主要表现在3个方面:第一,语言数据是数字技术发展的重要“物质基础”,可推动数字技术的创新发展和数字技术资本的积累;第二,语言数据是构成赖以判断和决策的信息和知识的重要“原始材料”,可提高资源配置效率,提升全要素生产率;第三,语言数据是新职业、新业态形成和发展的重要“助推器”,可深化社会分工,促进产业结构调整和优化。
(一)语言数据促进数字技术的创新发展
科学技术是第一生产力。在任何经济形态中,技术都是影响经济增长的重要变量。但在不同经济形态中,推动经济增长的具体关键技术不同。农业经济时代,农业生产技术是关键技术;工业经济时代,工业技术是关键技术,如机械制造技术;数字经济时代,以云计算、大数据、物联网、移动互联网、人工智能、区块链等为主的数字技术成为推动经济增长的关键技术。数字技术重塑了经济社会的生产模式、产业形态、商业模式,提升了资源配置效率(易宪容,等2019),其赋能并重构传统生产要素,提升农业、工业及服务业的产能效应,推动产业结构优化升级,形成高质量发展态势(王凯2021)。总之,数字技术是数字经济的核心驱动力,也是数字革命核心技术(刘平峰,张旺2021),对经济高质量发展具有显著促进作用,是当下经济高质量发展的重要引擎(任转转,邓峰2022)。
数据与数字技术相互依存,相互促进。云计算、大数据、物联网、移动互联网、人工智能等信息通信技术(ICT)新技术、新模式的发展和应用无一不是以海量数据为基础,又反过来带动了数据量的爆发式增长。[3]语言数据的采集、集聚、处理和应用无疑有赖于数字技术的发展,但反过来语言数据对数字技术的发展也不可或缺。语言是最重要的信息载体,是信息通信技术处理的主要对象。从计算器到计算机的突破,关键就在于二者处理的对象不同,计算器能处理的仅是数字,计算机还可处理语言文字,人类对提升语言文字处理能力和水平的孜孜追求是推动信息通信技术发展的重要力量。以移动通信技术和人工智能为例。人类移动通信技术发展历程显示,对语言文字处理和传输效率的追求是通信技术发展的重要驱动力,信息通信技术发展史可看作一部语言文字处理和传输能力不断提升、加速的历史。1G通信系统是基于模拟传输的,直接使用模拟语音调制技术;2G通信系统包含了全速率完全兼容的增强型话音编解码技术,使得话音质量得到质的改进,自适应语音编码(AMR)技术的应用,极大提高了系统通话质量;3G通信系统支持话音和多媒体数据通信,可提供高速数据、慢速图像和电视图像等各种宽带信息业务;4G通信系统具有超过2Mbit/s的非对称数据传输能力(张勉2007),可传输高质量音频、视频、图像和各种应用程序(APP);5G通信系统支持海量数据传输,高数据传输速率,超低时延,实现万物互联。如图1所示。语言数据是移动通信技术传输的主要内容,语言数据的形态、规模、结构、组合形式等对移动通信技术的发展有着重要影响。
图1 移动通信系统发展历程[4]
[3] 参见中国信息通信研究院《数据基础设施白皮书2019》,http://www.caict.ac.cn/kxyj/qwfb/bps/201911/t20191118_269749.htm。
[4] 此图在参考中国信息通信研究院《“5G +云+ AI”数字经济新时代的引擎》的基础上改进而成,参见http://www.caict.ac.cn/kxyj/qwfb/bps/201912/t20191209_271137.htm。
人工智能是诸多信息通信技术或新一代信息技术的集成(蔡跃洲,陈楠2019),广泛应用于社会经济领域,对经济高质量发展和数字技术的创新发展发挥着重要作用。人工智能与语言密切相关,冯志伟(2018)指出,“在人工智能这个领域,得语言者得天下”。语言对人工智能的重要性,又突出表现在语言智能上。语言智能是人工智能的重要组成部分,是语言科学与人工智能深度融合的前沿交叉领域,被誉为人工智能“皇冠上的明珠”。语言数据是语言智能发展的物质基础,语言数据质量的高低直接影响语言智能发展水平的高低(胡开宝,尚文博2022)。特别是在语言智能进入机器学习时代后,语言智能发展对语言数据的依赖程度越来越高。各种语言数据,特别是海量的话语数据,是人工智能发展的重要基础。如何建设高质量的语言数据库,为语言智能和人工智能发展提供“底层支撑”,是语言学和计算机学科共同努力的方向。其他数字技术的发展,如大数据、云计算、区块链等同样需要以海量的、多类型的、高质量的语言数据为基础。
(二)语言数据提升资源配置效率
数字经济与传统经济的区别在于,数字经济是以用户的需求端为导向,并以数字化、智能化的方式获得的信息为客户发现潜在的、不可见的需求,以及为客户创造新的需求,从而为客户提供定制化的产品与服务,并让客户在使用产品及获得服务的过程中不断创造新价值(易宪容,等2019)。简言之,数字经济的本质是将经过数字化处理后的数据转化为可投入生产的有用信息,这大大降低了供求两端不同经济主体之间的信息不对称,进而提高资源配置的效率,促进经济结构的优化。数据不是唯一的生产要素,但作为数字经济全新的、关键的生产要素,贯穿于数字经济发展的全部流程,与其他生产要素不断组合迭代,加速交叉融合,引发生产要素多领域、多维度、系统性、革命性群体突破,[5]其大量性、高速性、多样性、低价值密度性、真实性等特征,能够有效解决信息孤岛、数据鸿沟、信息不对称等问题(陈书晴,等2022)。语言数据是占比最大的数据类型,是数字化、智能化处理的核心内容,是构成赖以决策的信息的最重要的“原始材料”,在数据转化为有价值的信息和知识的全过程中都发挥着重要作用,可助力政府服务和数字治理的智能化,企业决策的智能化,提升整个社会的资源配置效率。例如,各类社交媒体平台的文本数据包含了经济主体(如投资者、消费者)丰富的情绪、情感等心理信息(洪永淼,汪寿阳2021),这些信息可反映企业、家庭、个体的选择偏好、投资倾向和需求状况,以及可能的行为选择,助力企业优化生产决策和营销策略。
[5] 参见中国信息通信研究院《中国数字经济发展白皮书》(2020年),http://www.caict.ac.cn/kxyj/qwfb/bps/202007/t20200702_
285535.htm。
图2 语言数据助力政府服务和企业决策的智能化示意图
以人力资源的优化配置为例。传统的人员招聘与配置过程中主要依靠经验判断与简单的统计分析,存在很强的主观性和模糊性,管理动作也往往具有滞后性(陈国青,等2020)。基于大数据的智能化人才管理,利用数字技术对求职人员的简历、以往学习或工作相关的文字数据、面试过程中的话语数据等组成的全方位的语言数据进行语义分析和数据挖掘,实现简历筛选、面试评估、人岗匹配和人才管理的全智能化,将最合适的人配置在最合适的岗位上。反过来,人才培养部门可通过对劳动力市场的招聘需求等语言数据的分析,提取人才需求信息,以培养与市场需求相匹配的人才。例如,中国信息通信院2018年选取数字经济就业关键检索词,对国内数十家主流招聘平台进行关键词检索,收集了168万余条数字经济招聘信息,建立起数字经济就业数据库,通过对就业数据库的数字化、智能化处理,展现了经济社会对数字经济就业方向、人才能力等的真实需求,[6]对我国数字经济人才的培养和流动具有重要指导意义。基于劳动力市场供需两侧语言数据的信息挖掘,可降低人才供给与市场需求之间的信息不对称,优化人才培养,提高人力资源配置效率。
[6] 参见中国信息通信研究院《中国数字经济就业发展研究报告:新形态、新模式、新趋势》,http://www.caict.ac.cn/kxyj/qwfb/ztbg/202007/t20200728_287278.htm。
(三)语言数据催生新职业和新业态
数字经济的发展催生了大量新职业、新岗位,语言职业类型多元化,需求增长迅速。2015年,我国颁布了《中华人民共和国职业分类大典》(以下简称《大典》),将职业分为8个大类、75个中类、434个小类、1481个职业。与1999年的《大典》相比,新版《大典》在涉及第一产业的“农、林、牧、渔业生产及辅助人员”大类中减少了6个小类、83个职业,在涉及第二产业的“生产制造及有关人员”大类中减少了24个小类、526个职业;同时在涉及第三产业的“专业技术人员”和“社会生产服务和生活服务人员”大类中,职业数量分别增加了11个和81个。2015年《大典》颁发以来,2019、2020和2021年人社部、市场监管总局、统计局又联合发布了56个新职业,主要为第三产业的职业。总体上看,第三产业的职业数量和就业人口显著增加。第三产业的职业为服务业职业,基本上都是以语言能力作为主要劳动工具,或者以语言为主要劳动对象。有的职业属于纯语言职业,如翻译、速录师、讲解员、语言教师、播音员等;有的职业对语言能力有较强的要求,如导游、医生、律师等。2015年《大典》及2019年之后新增的职业多为适应数据时代和数字经济发展需要而设置的,如快递员、人工智能工程技术人员、物联网工程技术人员、大数据工程技术人员、数字化管理师、在线学习服务师等。这些职业中,不少属于语言职业。如在线学习服务师、职业培训师、互联网营销师中的“直播销售员”是纯语言职业,而快递员、数字化管理师等职业都对语言能力有较高要求。如《快递员国家职业技能标准(2019年版)》规定快递员的职业能力特征为“具有较强的听写、理解、表达、应变、沟通和学习能力,能准确计算,分辨颜色,识别方位,动作协调”,语言能力是其中的核心能力。
《中国数字经济就业发展研究报告:新形态、新模式、新趋势》(以下简称《报告》)指出,在零工经济、平台经济、共享经济等新模式、新业态的引领下,网络销售、网络运营、淘宝客服、短视频审核、数据标注、外卖骑手等新型岗位不断涌现,成为热门岗位。这些岗位都以语言能力为核心能力。《报告》共检索到10万个电商客服相关岗位,吸纳就业人数达73万余人次;与数据标注相关的就业信息共1万余条,涉及语料标注、法律文书标注、外语听写标注、语音撰写标注等,其中93.4%的条目为兼职招聘,平均每个兼职岗位招聘471人次;2018年与网络运营有关的招聘条目共18万余条,工作内容主要为公众号维护、文案撰写、数据分析、规划推广等与语言文字密切相关的内容;网络主播招聘信息近7500条,招聘人数近14.3万人。[7]这些岗位多与语言数据的处理有关。数字经济的发展还将继续催生更多新的语言职业,涌向更多以语言能力为核心能力,以语言文字为主要工作内容或劳动对象的岗位。这些职业和岗位是数字经济带来的社会分工的结果,同时也是数字经济发展的重要支撑力量,应该得到更好的重视和培育。
[7] 参见中国信息通信研究院《中国数字经济就业发展研究报告:新形态、新模式、新趋势》, http://www.caict.ac.cn/kxyj/qwfb/ztbg/202007/t20200728_287278.htm。
数字经济带来生产方式的变革,数字技术的广泛应用推动了新业态、新模式的发展,也推动了语言产业的新发展,催生了一批与语言数据相关的新产业。以下以语言数据业和语言智能业为例加以分析。
语言数据业。语言数据业是指采用市场化经营方式生产语言数据产品或提供语言数据服务,满足国家或个人对各种语言数据产品或服务的多层次需求的生产或服务活动。包括对语言数据进行收集库存、管理经营、加工应用的行业,涉及语言数据的收集、语言数据库的建设、语言数据的云存储、语言数据的计算机应用、语言数据产品的营销、语言数据及其各种规范标准、语言数据产业人才的培养等业态(李宇明2020)。2021年12月,国务院印发《“十四五”数字经济发展规划》(国发[2021]29号),这是我国数字经济领域的首部国家级专项规划。规划提出“支持市场主体依法合规开展数据采集,聚焦数据的标注、清洗、脱敏、脱密、聚合、分析等环节,提升数据资源处理能力,培育壮大数据服务产业”,而数据服务产业中很大部分属于语言数据产业。在数字技术推动下,社会各界对数据,特别是标准化数据的需求日益增长,语言数据产业具有广阔的发展前景。如数据标注业。数据标注指通过贴标签、做记号、标颜色、划重点的方式,标注出数据的不同点、相似点或类别,为机器提供训练和学习资料的过程。数据标注业是指以语言数据标注为核心业务的经营性活动的集合。随着对标准化数据需求的增长,数据标注业已成为一个新兴产业形态。《中国数字经济发展白皮书》(2020年)指出,数据标注有望成为撬动产业规模发展的新引擎,预计到2025年我国数据标注核心产业规模将达500亿元,带动相关产业规模达到1800亿元。[8]
[8] 参见中国信息通信研究院《中国数字经济发展白皮书》(2020年),http://www.caict.ac.cn/kxyj/qwfb/bps/202007/t20200702_
285535.htm。
语言智能业。语言智能旨在运用计算机技术和信息技术,让机器理解、处理和分析人类语言,实现人机语言交互(胡开宝,田绪军2020),使机器在一定程度上拥有理解、应用和分析人类语言的能力(胡开宝,尚文博2022)。语言智能业包括机器翻译、语音转写、语音输入法、语言智能测评、智能教学、智能写作、智能客服、交互式智能问答、情绪识别等多种业态,在经济社会中已经产生巨大影响。据统计,语音智能领域单位技术产出高于人工智能行业整体:目前我国人工智能创业项目中有252家处于语音识别和语义分析赛道,占总量的10.6%;截至2018年底,我国人工智能领域申请专利44.4万件,其中,语音识别与自然语言处理技术申请专利6.1万件,占比达13.6%。[9]《2020~2021中国智能语音产业发展白皮书》显示,2021年我国智能语音产业市场规模预计达到285亿元,同比增长44%。随着智能语音技术的成熟和市场对智能化需求的不断扩大,智能语音产业将保持高速增长,预计2025年国内前装车载语音市场规模约为32亿元,2030年仅我国翻译机市场规模就将达到56.2亿元。语言智能产业具有广泛的行业关联性和丰富的上下游应用场景。其上游包括以信息资源处理为主导的信息收集、分析、处理服务,以翻译资源为主导的翻译服务,以及以技术资源为主导的技术服务、数字内容加工等;下游包括教育培训、语言研究、文化出版、智能客服、动漫、智慧旅游、智慧物流、智慧交通、科技情报等多种行业,与数字产业化和产业数字化发展息息相关。随着以5G、人工智能、工业互联网、物联网、云计算、区块链等现代信息技术为基础的新型基础设施建设的深入推进和智慧城市的发展,语言智能产业将会迎来更大的发展空间。
[9] 参见李艳,贺宏志《大力发展语言产业 服务国家语言战略》,《中国教育报》,2020年10月10日第3版。
三、挖掘语言数据的经济红利
语言数据已展现出强经济属性,在促进经济增长方面发挥实质性作用。但目前人们的语言数据经济意识还较薄弱,语言数据成为生产要素的转化率亟待提高,语言数据经济红利的挖掘空间巨大。
(一)树立语言数据的经济属性意识
首先,要树立语言数据意识,强化语言数据概念。目前,“语言数据”在中文语境里还是较新且较少使用的概念,本质上是对“语言数据”的重要性认识不足,研究还比较薄弱(李宇明,王春辉2022)。语言数据与语言资源密切相关,但又有区别。语言数据与现代信息技术密切相关。如果说语言资源是加工提炼后可供使用的石油,那么语言数据就是尚待开采和加工处理的原油。数字技术带来了语言数据的爆炸式增长,扩大了“原油储量”,同时又大大提升了将语言数据转化为语言资源的可能性和效率,提高了“原油开采率”。树立语言数据意识,强化语言数据概念,是适应数字化发展的需要,也是深化语言学与计算机科学融合发展的需要。其次,要树立语言数据的经济属性意识。数据是数字经济的关键生产要素,目前已逐渐成为一种社会共识,语言数据作为最重要的数据具备进入经济生产领域的潜质。树立语言数据的经济属性意识,就是要将语言数据置于社会经济系统中进行观察,研究其成为生产要素的条件、路径和机制,以及如何对其他生产要素产生倍增效应,实现对语言数据的经济开发利用,这是更好发挥数据生产要素功能的需要。
(二)推动语言数据价值化
数据资源具有潜在价值,只有将数据和数据的采集、存储、处理、分析、应用等一系列劳动相结合,创造价值、实现价值并实现价值增值(倍增)才能发挥数据的作用(李海舰,赵丽2021)。语言数据经济属性的完全释放同样需要一个价值化的过程。本文参考李海舰,赵丽(2021)的方法,将语言数据形态演进的过程分为“语言数据——语言数据资源——语言数据资产(产品)——语言数据商品——语言数据资本”5个环节。最前面的“语言数据”环节是本文所加,因为我们认为语言数据不同于语言数据资源,海量的语言数据只有通过数字技术按照一定的标准采集、加工,形成可供机器或人使用的资源,才能具有了资源属性,这是一个价值挖掘的过程。语言数据资产(产品)是指能够带来预期经济收益的语言数据资源,不是所有的语言数据资源都可以变为语言数据资产或产品,只有进行数字化、智能化转化,成为企业决策信息的语言数据资源才能成为企业资产。例如,某电商平台通过对消费者购买信息、客户评价等文本数据的挖掘,获取了消费者偏好和需求等方面的信息,进而对产品生产和营销决策进行调整,实现精准投放,提高企业生产效率,这就是语言数据资源资产化的过程,创造了价值。语言数据商品是指可以在市场上交换的语言数据产品,交换环节使语言数据作为商品的价值得以实现。如前例,电商平台将生产的语言数据资产(产品)在市场上出售,获得收益。数据商品向数据资本转变的关键是,在市场上用于交换的数据商品的交换价值是否被充分挖掘和无限放大,形成对数据劳动者劳动成果的无限次重复使用,并生成价值增值(倍增)的数据资本(李海舰,赵丽2021)。这个过程是社会生产对语言数据的充分利用。语言数据向语言数据资源、语言数据资产(产品)转化的过程中,需要数字技术的广泛参与,涉及语言数据的采集、清洗、标注、脱敏、脱密、聚合、语义挖掘等,语言数据资源和产品的质量直接关系到语言数据商品的销售和资本化。在语言数据价值化的整个过程中,最重要的是语言数据产权的确认问题,只有明晰产权,语言数据才能实现交换和价值增值。语言数据价值化的过程如图3所示。
图3 语言数据价值化过程[10]
[10] 此图在李海舰、赵丽《数据成为生产要素:特征、机制与价值形态演进》基础上改进而成。
(三)发展语言数据相关职业和产业
数字技术的发展依赖于语言数据,同时又创造了海量语言数据。对语言数据的采集、清洗、标注、分析、销售等都需要专门的人才。随着社会分工的精细化,数字经济的发展将催生一批与语言数据相关的专门职业,如数据标注等。需加强对语言数据职业和岗位的语言能力要求分析与人才培养。同时应加大对语言数据产业的培育,促进语言数据产业与相关产业的融合,增强语言数据产业的前向后向效应,如加强语言数据产业与语言智能产业的融合发展,优化产业结构,等等。
四、结 语
在生产要素变革、生产方式改变的大背景下,数据成为数字经济的关键生产要素,语言数据作为最重要的数据类型是语言参与社会生产的一种新形式,展现出显著的经济属性,在促进数字技术创新发展和数字技术资本积累,优化资源配置和产业结构,深化社会分工,提高全要素生产率中发挥重要作用。挖掘语言数据经济红利,需要树立语言数据经济意识,推动语言数据价值化,培育和发展语言数据相关职业和产业。
《“十四五”数字经济发展规划》指出,“十四五”时期,我国数字经济转向深化应用、规范发展、普惠共享的阶段,提出数据要素市场体系初步建立、产业数字化转型迈上新台阶、数字产业化水平显著提升、数字化公共服务更加普惠均等、数字经济治理体系更加完善等目标。对语言数据和数字经济关系的研究,体现了语言学者面向国家需求、回应社会重大问题的使命担当和家国情怀,也是新时代语言经济学的新使命。本文抛砖引玉,仅做了些粗浅探索,还需学界凝聚智慧,深入研究。语言学、经济学和计算机学科等相关学科应加强联系,合力研究和解决语言数据与数字经济发展中的关键问题。第一,认识数字经济的本质和发展规律,研究语言和语言数据作用于数字经济的机制和路径,特别是语言数据成为生产要素的条件、机制以及对其他生产要素的影响等;第二,调查数字经济驱动下的语言产业发展现状,制定语言产业发展规划,培育新语言职业和语言产业,推动语言数据相关产业与其他数字产业的融合发展;第三,研究数字经济发展中的语言数据服务问题,包括语言数据的收集、清洗、标注、分析、流通等相关的系列服务,以及语言数据产业发展中的语言服务问题,如语言数据标注的标准制定等;第四,研究适应数字经济发展的语言人才培养问题,以市场需求为导向培养跨学科、复合型、具有数字素养的语言人才,提升劳动力素质。
* 2021年国际中文教育课题一般项目“社会力量参与国际中文教育的现状调查与机制建设研究”(21YH62C),国家语委“十四五”科研规划2021年度重大项目“我国语言文字治理体系现状及创新研究”(ZDA145‒1),国家语委“十三五”科研规划2019年度重大项目“粤港澳大湾区语言状况及规划研究”(WT135‒58),国家社会科学重大项目“‘两个一百年’背景下的语言国情调查与语言规划研究”(21&ZD289)。
该文发表于《语言战略研究》2022年第4期,参考文献从略,如有需要请参照原文。
编排:韩 畅
审稿:王 飙 余桂林
相关推荐
《语言战略研究》2022年第3期目录与提要《语言战略研究》2022年第2期目录与提要《语言战略研究》2022年第1期目录与提要
喜讯!我刊入选CSSCI(2021—2022)扩展版!我刊入编《中文核心期刊要目总览》2020年版语言、文字类核心期刊!喜讯!我刊入选人大《复印报刊资料重要转载来源期刊(2020年版)》!C刊公号影响力——《语言战略研究》“语言交叉学科”专题受欢迎
约稿启事丨“语言与跨国公司”专题 约稿启事丨“儿童语言教育”专题 约稿启事丨“海峡两岸语言问题研究”专题